\chapter{Conclus\~{a}o}

\section{Conclus\~{o}es gerais}

Neste trabalho foi abordado o problema inverso relacionado com a determina\c{c}\~{a}o 
do potencial intermolecular atrav\'{e}s do segundo coeficiente do virial, este problema  
j\'{a} vem sendo tratado com t\'{e}cnicas como regulariza\c{c}\~{a}o de Tikhonov e decomposi\c{c}\~{a}o 
em valores singulares (SVD) \cite{JOAO9801,JOAO9802}, mas este trabalho \'{e} o primeiro a 
abord\'{a}-lo usando RNAs \cite{BARROS9801,BARROS9802}.

Este problema inverso, devido \`{a} sua caracter\'{\i}stica de mal condicionamento, reveste-se 
de grande complexidade, principalmente ao apresentar solu\c{c}\~{o}es pouco est\'{a}veis e n\~{a}o 
\'{u}nicas. 
Foram utilizados os modelos de RNAs denominados 
rede neural com fun\c{c}\~{a}o de base radial (RBF) e rede de Boltzmann discretizada (RBD), sendo 
este \'{u}ltimo uma contribui\c{c}\~{a}o desta disserta\c{c}\~{a}o. Al\'{e}m disso, foi descrita como a 
aplica\c{c}\~{a}o de um terceiro modelo de RNAs, conhecido como rede de Hopfield, pode ser
\'{u}til na resolu\c{c}\~{a}o de problemas mal colocados.

Os resultados obtidos por RBF podem ser considerados animadores, principalmente quando 
se verifica todos os problemas que foram superados pela rede. Um deles est\'{a} relacionado 
com o conjunto de dados, que pode ser considerado reduzido quando se analisa o problema do
ponto de vista de treinamento de redes neurais. O fato de se ter obtido centros fixos como 
melhor m\'{e}todo de treinamento, ou seja, a utiliza\c{c}\~{a}o de todos os vetores de dados como centros 
para as RBFs, evidencia esta car\^{e}ncia de informa\c{c}\~{a}o. Provavelmente em um sistema com um 
conjunto de dados maior, a escolha recairia no m\'{e}todo {\em Forward Selection}.
Outro problema enfrentado foi a instabilidade num\'{e}rica, que pode ser verificada facilmente 
atrav\'{e}s da determina\c{c}\~{a}o do condicionamento da matriz gerada pelo mapeamento multidimensional 
da rede RBF (ver Equa\c{c}\~{a}o \ref{EQMATRIZ-PROJETO}). Neste ponto, a ado\c{c}\~{a}o da t\'{e}cnica conhecida 
como regulariza\c{c}\~{a}o foi crucial para a estabiliza\c{c}\~{a}o da solu\c{c}\~{a}o, atrav\'{e}s da adi\c{c}\~{a}o de alguma informa\c{c}\~{a}o 
{\em a priori} ao problema. 
Mesmo os  erros percentuais obtidos durante a generaliza\c{c}\~{a}o terem se 
mostrado elevados para as constantes $C_8$ e $C_{10}$, isto n\~{a}o foi suficiente para afetar a 
invers\~{a}o, uma vez que a contribui\c{c}\~{a}o destes coeficientes \'{e} pequena.
Em contrapartida, os resultados para a constante $C_6$ apresentaram erro percentual m\'{e}dio 
baixo, tornando poss\'{\i}vel a reconstru\c{c}\~{a}o do potencial intermolcular.

A utiliza\c{c}\~{a}o pr\'{a}tica desta t\'{e}cnica \'{e} potencial. Primeiro porque a rede j\'{a} estaria treinada com todos
os sistemas qu\'{\i}micos poss\'{\i}veis, sem que fosse necess\'{a}rio a elimina\c{c}\~{a}o de algum deles para o teste 
de generaliza\c{c}\~{a}o (como feito na valida\c{c}\~{a}o dos resultados deste trabalho). Isto evitaria a 
diminui\c{c}\~{a}o da informa\c{c}\~{a}o contida na rede. 
Valores para o virial poderiam ent\~{a}o ser obtidos experimentalmente e o potencial 
intermolecular determinado pela rede. 
Al\'{e}m disso, como os resultados obtidos com o pr\'{e}-tratamento dos dados atrav\'{e}s da 
t\'{e}cnica conhecida como PCA foram um pouco superiores, a divis\~{a}o dos sistema qu\'{\i}micos em suas fam\'{\i}lias 
afins se torna tamb\'{e}m um procedimento a mais que deve ser adotado.

J\'{a} os resultados para a RBD n\~{a}o conseguiram superar por completo a quest\~{a}o da instabilidade 
da solu\c{c}\~{a}o. Como o problema apresenta m\'{u}ltiplas solu\c{c}\~{o}es, a RBD encontra solu\c{c}\~{o}es 
relativamente precisas, mas diferentes entre si. Isto pode ser notado ao se observar que as 
solu\c{c}\~{o}es obtidas pela rede n\~{a}o apresentaram todos os seus nodos convergindo para um mesmo valor num\'{e}rico. 
Uma primeira  provid\^{e}ncia que poderia ser tomada seria a mudan\c{c}a de regulariza\c{c}\~{a}o global para local.  
Um par\^{a}metro de regulariza\c{c}\~{a}o diferenciado por nodo pode se tornar mais eficaz ao tentar 
minimizar localmente a instabilidade, sem influenciar os outros nodos.
A mudan\c{c}a do termo de regulariza\c{c}\~{a}o tamb\'{e}m \'{e} interessante, procurando um que melhor se 
ajuste ao problema em quest\~{a}o. A participa\c{c}\~{a}o de um especialista na escolha deste termo pode 
ser fundamental para um bom desempenho da rede. \'{E} importante notar que, 
uma vez que a pseudo-inversa n\~{a}o pode ser usada nestes casos mal colocados, 
uma pesquisa mais detalhada sobre os t\'{o}picos acima citados \'{e} justificada, sendo fortemente 
incentivada.

\section{Trabalhos futuros}

Com rela\c{c}\~{a}o \`{a} rede neural RBF, algumas extens\~{o}es deste trabalho se tornam quase 
autom\'{a}ticas. Uma delas \'{e} o treinamento da rede para prever os outros par\^{a}metros 
que descrevem o potencial. Com isso, o potencial de curto alcance poderia ser 
tamb\'{e}m determinado e todo o potencial intermolecular reconstru\'{\i}do usando-se RNAs. 
\'{E} importante notar que o fato de se 
trabalhar separadamente com potencial de longo e curto alcance \'{e} bem comum em
qu\'{\i}mica. Al\'{e}m disso, uma vez que a t\'{e}cnica de treinamento est\'{a} bem estabelecida,
a aplica\c{c}\~{a}o da rede para gerar para os outros par\^{a}metros \'{e} quase imediata. Outro fato evidenciado 
est\'{a} relacionado com a fam\'{\i}lia de potenciais. O cap\'{\i}tulo anterior deixou claro que ao se
agrupar os dados primeiramente em suas fam\'{\i}lias qu\'{\i}micas afins, os resultados 
obtidos se tornam mais precisos. Esta classifica\c{c}\~{a}o poderia ser feita por algum m\'{e}todo
auto-organizativo ou mesmo atrav\'{e}s de sele\c{c}\~{a}o pr\'{e}via feita por um especialista.
Ainda sobre RBF, uma sugest\~{a}o final \'{e} a utiliza\c{c}\~{a}o de {\em Forward Selection} com 
regulariza\c{c}\~{a}o, como descrito no trabalho de Mark Orr \cite{MARKORR9501}. Como o
m\'{e}todo de {\em Forward Selection} mostrou melhores resultados quando se tem apenas
um ou dois nodos a generalizar e a regulariza\c{c}\~{a}o quando  um n\'{u}mero maior
de nodos (Ap\^{e}ndice \ref{APCMPMET}) \'{e} usado, 
\'{e} prov\'{a}vel que a utiliza\c{c}\~{a}o conjunta desses dois m\'{e}todos possa ser mais eficiente.

Na aplica\c{c}\~{a}o atrav\'{e}s de rede de Hopfield, descrita no Cap\'{\i}tulo \ref{LAB-REDE-HOPFIELD}, 
a sugest\~{a}o \'{e} que seja introduzido um termo de regulariza\c{c}\~{a}o na fun\c{c}\~{a}o de energia
proposta por Vemuri (Equa\c{c}\~{o}es \ref{EQ-METODO-A} e \ref{EQ-METODO-B}) com o 
objetivo de estabilizar a solu\c{c}\~{a}o e tornar a converg\^{e}ncia mais r\'{a}pida. Esta sugest\~{a}o 
surgiu uma vez que alguns testes realizados com as fun\c{c}\~{o}es de energia descritas por Vemuri
apresentaram resultados muito dependentes da estimativa inicial e levaram muito tempo
para a converg\^{e}ncia. 

Para a rede de Boltzmann discretizada v\'{a}rios aperfei\c{c}oamentos ainda s\~{a}o 
necess\'{a}rios. Um deles est\'{a} relacionado com o formalismo matem\'{a}tico. Baseando-se 
no trabalho de  Vanderbilt e Louie \cite{VANDERBILT8401} parece ser poss\'{\i}vel
obter uma express\~{a}o para ajuste do passo. Isto seria uma grande contribui\c{c}\~{a}o
para o modelo, pois iria diminuir bastante o tempo de treinamento e aumentar a 
precis\~{a}o final, uma vez que o treinamento \'{e} sempre feito com um passo \'{o}timo.
Outro ponto importante seria obter uma express\~{a}o que estabelecesse uma rela\c{c}\~{a}o
\'{o}tima entre o passo e o multiplicador da fun\c{c}\~{a}o de energia. Quanto mais ajustados
melhor seria o desempenho da rede, pois a energia seria sempre avaliada com um
multiplicador que fornecesse mais certeza no processo de decis\~{a}o do pr\'{o}ximo 
valor do nodo. Aliado a estes fatores, um algoritmo de treinamento que tirasse proveito do
paralelismo existente nos modelos de Boltzmann (ver Se\c{c}\~{a}o \ref{LAB-PARALELISMO})
poderia otimizar o tempo de busca.

Uma sugest\~{a}o final seria o levantamento de uma an\'{a}lise sensitiva, com o objetivo 
de verificar o quanto os potenciais invertidos usando-se RNAs s\~{a}o influenciados 
pelos erros nos dados experimentais.




